Estatística Descritiva

Conceitos Básicos

Rodrigo Citton P. dos Reis, Dep. de Estatística - UFRGS

Agosto de 2020

Introdução

Dados \(\leadsto\) Conhecimento

Em alguma fase de seu trabalho, o pesquisador depara-se com o problema de analisar e entender um conjunto de dados relevante ao seu particular objeto de estudos. Ele necessitará trabalhar os dados para transformá-los em informações, para compará-los com outros resultados, ou ainda para julgar sua adequação a alguma teoria.

Uma representação

Uma representação mais ousada!

O Método Científico

De modo bem geral, podemos dizer que a essência da Ciência é a observação e que seu objetivo básico é a inferência.

De modo bem geral, podemos dizer que a essência do Aprendizado (da Evolução).

Conceitos básicos

O que é a estatística?

A estatística1 Do grego statistós, de statízo, “estabelecer”, “verificar”, acrescido do sufixo ica. é a ciência que tem por objetivo orientar a coleta, o resumo, a apresentação, a análise e a interpretação de dados. Podem ser identificadas duas grandes áreas de atuação desta ciência:

O que é a estatística descritiva?

A Estatística Descritiva corresponde aos procedimentos relacionados com a coleta, elaboração, tabulação, análise, interpretação e dos dados. Isto é, inclui as técnicas que dizem respeito à sintetização e à descrição de dados numéricos. Estas técnicas podem ser utilizadas em pelo menos dois contextos:

Tais métodos tanto podem ser gráficos como envolver análise computacional.

Estatística descritiva: alguns exemplos

Descriptive Statistics

tobacco

N: 1000

  age BMI cigs.per.day samp.wgts
Mean 49.60 25.73 6.78 1.00
Std.Dev 18.29 4.49 11.88 0.08
Min 18.00 8.83 0.00 0.86
Q1 34.00 22.93 0.00 0.86
Median 50.00 25.62 0.00 1.04
Q3 66.00 28.65 11.00 1.05
Max 80.00 39.44 40.00 1.06
MAD 23.72 4.18 0.00 0.01
IQR 32.00 5.72 11.00 0.19
CV 0.37 0.17 1.75 0.08
Skewness -0.04 0.02 1.54 -1.04
SE.Skewness 0.08 0.08 0.08 0.08
Kurtosis -1.26 0.26 0.90 -0.90
N.Valid 975.00 974.00 965.00 1000.00
Pct.Valid 97.50 97.40 96.50 100.00
  Freq % Valid % Valid Cum. % Total % Total Cum.
F 489 50.00 50.00 48.90 48.90
M 489 50.00 100.00 48.90 97.80
<NA> 22 2.20 100.00
Total 1000 100.00 100.00 100.00 100.00

Unidades experimentais e observacionais

Unidade experimental ou unidade de observação é a menor unidade a fornecer informação.

Crash course de inferência causal

  • Qual o melhor tratamento para o choque séptico?

Dois tipos de estudo podem ser conduzidos para responder a esta questão de pesquisa:

  1. Em um experimento aleatorizado (randomized trial), uma moeda justa é lançada repetidamente para designar o tratamento de cada paciente.
  2. Um estudo observacional é uma investigação empírica em que o objetivo é elucidar relações de causa e efeito, em que não é factível o uso de experimentação controlada, no sentido de ser capaz de impor procedimentos ou tratamentos cujos os efeitos se deseja descobrir.

Experimentos: exemplo

  • “O chá servido sobre o leite parecia ficar com gosto diferente do que apresentava ao receber o leite sobre ele”3 Salsburg, D. Uma senhora toma chá … como a estatística revolucionou a ciência no século XX, Zahar, 2009..

Estudos observacionais: exemplo

  • “O Ministério da Saúde adverte: fumar pode causar câncer de pulmão”.

1. Elabore uma questão de pesquisa de seu interesse (anote a sua questão em algum lugar).
2. Discuta a respeito da sua questão de pesquisa com os colegas.

Dados e variáveis

Dados

São as informações obtidas de uma unidade experimental ou observacional.

  • Ex: “Vitor tem 25 anos e é fumante”. Os dados são “25 anos” e “fumante”.

Variável

É toda característica que, observada em uma unidade (experimental ou observacional), pode variar de um indivíduo para outro.

  • Ex: idade, sexo, altura, nível de hemoglobina no sangue, espaçamento entre plantas, doses de um medicamento, tipo de medicamento, cultivares, número de caracteres, velocidade da rede, tempo gasto na rede social, nível de monóxido de carbono em emissões do escape de automóveis, etc.

É importante identificar que tipo de variável está sendo estudada, uma vez que são recomendados procedimentos estatísticos diferentes em cada situação.

Tipos de variáveis

Variáveis quantitativas

Variáveis quantitativas discretas

Variáveis quantitativas contínuas

Variáveis qualitativas

Variáveis qualitativas ordinais

Variáveis qualitativas nominais

Exemplos (1)

Exemplos (1)

Variáveis quantitativas

  • 3 andares
  • 14,85 metros de altura

Variáveis qualitativas

  • Multicolorido
  • Cheira “bem”

Exemplos (2)

Exemplos (2)

Variáveis quantitativas

  • 4 integrantes
  • 56 anos

Variáveis qualitativas

  • Inglaterra
  • Rock

Exercício

  1. Com base na questão de pesquisa elaborada no exercício anterior, liste variáveis que você teria interesse em coletar e analisar para responder a sua questão de pesquisa.
  2. Classifique as variáveis de acordo com a classificação discutida anteriormente.
  3. Discuta a respeito das suas variáveis com os colegas.

População

Censo e amostra

Censo vs. amostra

À primeira vista, uma coleta de dados realizada em toda a população é preferível a uma realizada apenas numa parte da população. Na prática, entretanto, o oposto é frequentemente verdadeiro porque:

  1. Um censo é impossível quando a população é infinita.
  2. Os ensaios (testes) podem ser destrutivos .
  3. Rapidez: estudar toda a população pode despender de muito tempo, não sendo compatível com a urgência do estudo .

Para uma consideração mais completa ver Vargas (2000).

Amostra

Amostra representativa

Amostragem

Amostra aleatória simples

Amostra estratificada

Amostra sistemática

Amostragem

Parâmetros, estatísticas e estimativas

Parâmetros, estatísticas e estimativas

Próxima aula

Para casa

Por hoje é só! Bons estudos!